中国首个成功在野外徒步的双足机器人,先进在哪?
近日,一个双足机器人在完全陌生的野外环境中,基于强化学习,完成了零样本、无保护、全开放的徒步测试的视频,引发业界广泛关注。视频展示了「逐际动力双足机器人P1」在复杂地形上展现出惊人的控制力和稳定性,高动态完成了一系列挑战性移动任务, 这对于普通人而言也是不容易实现的。
国内多家权威媒体,如新华社、参考消息等对视频进行了转发推广,反响热烈:
YouTube上网友也纷纷对P1表示惊叹:
长期以来,由于双足行走的高度非线性、强耦合及环境干扰等因素,实现类人稳定行走一直是机器人领域的世界级难题。全球范围内的双足机器人大多局限于实验室环境,鲜有在真实复杂环境中获得长距离稳定行走的成功案例。
事实上,P1在仿真训练中并未接触过任何森林、徒步相关数据,却能在真实环境中"开箱即用",应对各种突发状况和不确定因素,展现出极强的环境适应能力和鲁棒性。
双足机器人P1在蔓藤缠绕的斜坡上稳步行走
此次P1的展示不仅刷新了业界对双足机器人野外徒步能力的认知,更重要的是,作为一个为人形机器人应用做准备的先进测试平台,它所取得的这一突破性进展有望加速人形机器人技术的成熟和从实验室走向更广阔应用场景的进程。
▍强化学习“破局”双足机器人运动控制难题
足式机器人的运动控制可分为传统控制方法和深度强化学习两类。传统方法,如轨迹优化和模型预测控制,需要算法设计者有充分的特定领域知识,但这种方法在复杂地形中难以实现。而深度强化学习可减少对特定领域知识的依赖,通过在模拟器中训练神经网络,再迁移到真实世界,即"模拟到真实迁移",训练出的策略往往更具鲁棒性。
然而,将强化学习应用到实体机器人上,面临不少技术难题,如算法泛化、样本效率、仿真到实际应用的鸿沟,以及跨场景的适应性等。这些挑战对研发团队的能力提出了很高要求。
在全球范围内,将强化学习与人形机器人运动控制相结合是一个极具挑战性的课题,目前只有少数机构能够在这一领域取得突破性进展。这些先进成果为该领域的发展提供了宝贵的前瞻性研究经验。例如,国际上首例成功利用强化学习方法实现Digit机器人硬件行走的研究,开创了强化学习在人形机器人运动控制领域应用的新局面,展现了这一技术路线的巨大潜力。
逐际动力公司目前三大产品
作为该领域的后起之秀,逐际动力凭借多年来在机器人和人工智能领域的技术积淀,建立了一套系统化的强化学习研发体系。据机器人大讲堂了解,该研发体系覆盖了从现实世界到仿真再回到现实的完整数据处理流程,创新性的神经网络架构设计,以及数据生成和训练方法的改进。通过这种方法,逐际动力不仅提升了算法的性能,也加速了机器人产品从研发到市场的过程。
▍逐际动力系统化强化学习研发体系
机器人大讲堂了解到,Real2Sim2Real闭环是逐际动力强化学习研发体系的一大亮点。通过打通从真实世界数据采集到仿真模型生成,再到策略部署的全链路,逐际动力实现了数据流动的自动化闭环。这不仅大幅降低了人工干预,提高了训练效率,更缩小了仿真与现实间的差距,为机器人策略的迁移应用奠定了坚实基础。
双足机器人P1在狭窄沟渠中高动态稳定行走
在神经网络架构设计上,逐际动力将网络划分为多个功能模块,并对每个模块的输入输出界面进行精细定义,构建起一个高度系统化的复杂结构。这种独特的模块化设计赋予了机器人极强的环境自适应能力,使其能够灵活应对不同场景和硬件差异带来的干扰,大大拓展了单一神经网络的适用范围。
数据生成与训练算法是强化学习的关键。逐际动力创新性地提出了迭代式预训练方法,通过对机器人基础运动能力的分级预训练,循序渐进地产出和收集高价值数据,从而得到更加可控、高效的训练结果。这一方法有效解决了有效数据稀缺的难题,为训练高性能策略提供了有力支撑。
双足机器人P1在崎岖山路上行走自如
机器人大讲堂分析认为,逐际动力双足机器人P1在复杂环境中的优异表现,初步证明了其强化学习研发体系的有效性和创新性。这一体系聚焦机器人领域的关键技术难题,为推动人形机器人的进步和应用拓展提供了新的思路。虽然这些技术的真正价值还需要在更广泛场景中得到验证,但逐际动力的探索方向和成果已然展现出了巨大潜力,值得业界持续关注。
▍从P1到人形机器人的进阶之路
P1既是逐际动力强化学习系统化研发和模块化测试的重要平台,也用于推进双足基础运动能力的研发和迭代,这显现了该企业在未来人形机器人研发方向上采取的系统化策略。
人形机器人的研发,当前面临的最大挑战之一是如何平衡高昂的研发成本与技术的可行性。在这样的背景下,采取分阶段、聚焦核心技术的研发策略成为了一个务实且高效的选择。
在实际操作中,P1的模块化设计理念为技术迭代提供了灵活性和高效性,这与当前机器人技术快速迭代的行业特点高度契合。模块化设计不仅能够快速适应不同的研发需求,调整和升级关键组件,更重要的是,能够为机器人未来的升级提供方便,降低了长期研发的复杂度和成本。
同时,逐际动力在P1中对双足移动技术的深入研究,体现了对人形机器人最核心技术挑战的直面。动态步态规划和姿态平衡控制是实现高效、稳定行走的关键,逐际动力通过不断的技术迭代,展现了在这一领域的研发实力。此外,对于操作和移动操作技术的持续研究,预示着逐际动力在打造更加高级、功能全面的人形机器人方面的长远布局。
双足机器人P1在猛烈击打下表现出强大的抗干扰能力
官方信息显示,P1是一款专为科研用户设计的开放平台,尤其适用于控制、机械、电子、计算机、人工智能及自动化等领域的探索。其显著特点在于高稳定性与耐用性,能够应对各种复杂环境;同时,高扩展性为研究者提供了丰富的感知套件和软件开发可能性,满足个性化需求。此外,P1还具备易维护、易上手的特性,并提供了丰富的参考资料,为科研人员在人形机器人领域取得创新成果提供了有力支持。
▍结语
回归到逐际动力双足机器人P1此次在野外环境的表现,这不仅彰显了该公司在强化学习研发体系上的深厚积累和创新能力,也为整个行业探索双足及人形机器人提供了宝贵的经验和启示。
在另一个舞台上,瓦力机器人同样在2024年NVIDIA GTC现场引起了热烈关注。英伟达CEO黄仁勋与这款由迪士尼研究中心打造、搭载英伟达Jetson嵌入式系统的机器人进行了互动。据了解,瓦力是利用英伟达Isaac Sim高性能仿真器进行训练,最终获得了出色的行走能力。
若P1与瓦力相遇,将会上演怎样的一幕呢?两款机器人会不会呈现出激萌的"Battle"画面?更重要的是,无论是P1还是瓦力,它们的出现和持续进化,都意味着人类在强化学习驱动的双足及人形机器人领域取得了新的突破,为未来发展奠定了坚实基础。我们完全有理由期待,在先进技术的驱动下,这一领域有望孕育出更多优秀的机器人产品,为人类生活和生产带来全方位的革新。
如需咨询企业合作事宜,欢迎联系堂博士(13810423387,手机与微信同号)进行对接。
工业机器人企业
埃斯顿自动化 | 埃夫特机器人 | 节卡机器人 | 珞石机器人 | 法奥机器人 | 非夕科技 | CGXi长广溪智造 | 大族机器人 | 越疆机器人 | 睿尔曼智能 | 优艾智合机器人 | 阿童木机器人 | 盈连科技
服务与特种机器人企业
医疗机器人企业
元化智能 | 天智航 | 思哲睿智能医疗 | 精锋医疗 | 佗道医疗 | 真易达 | 术锐®机器人 | 罗森博特 | 磅客策 | 柏惠维康
人形机器人企业
优必选科技 | 宇树 | 达闼机器人 | 云深处 | 理工华汇 | 傅利叶智能 | 逐际动力 | 乐聚机器人 | 星动纪元 | 天链机器人
核心零部件企业
绿的谐波 | 因时机器人 | 脉塔智能 | 伟景智能 | 锐驰智光 | 地平线 | 本末科技 | NOKOV度量科技 | 青瞳视觉 | 因克斯 | 蓝点触控 | 福德机器人
教育机器人企业
加入社群
欢迎加入【机器人大讲堂】读者讨论群,共同探讨机器人相关领域话题,共享前沿科技及产业动态。
教育机器人、医疗机器人、腿足机器人、工业机器人、服务机器人、特种机器人、无人机、软体机器人等专业讨论群正在招募,添加微信“robospeak2018”入群!
兼职作者&投稿
机器人大讲堂正在招募【兼职内容作者】,如果您对撰写机器人【科技类】或【产业类】文章感兴趣,可以将简历和原创作品投至邮箱:liuzk@leaderobot.com
我们对职业、所在地没有要求,欢迎朋友们的加入!
看累了吗?戳一下“在看”支持我们吧